1
算術公平與加權智慧
MATH801B-PEP-CNLesson 5
00:00
「算術公平」權重均等 (1:1:1)內容能力效果「加權智慧」各有其重 (5:3:2)內容能力效果
在數據的世界裡,並非所有資訊天生就具有同等地位。當我們處理「例1 演講比賽」的成績時,若將內容、能力和效果的分數直接相加後除以3,這就是「算術公平」——每個維度的權皆為1,毫無偏頗。然而,在真實的競爭與決策中,評委往往更重視某一項能力,此時引入不同大小的「權(weight)」,便展現出一種精準刻畫事實的「加權智慧」

理解「權」與加權平均數

一般而言,若 $n$ 個數 $x_1, x_2, \cdots, x_n$ 的權分別為 $w_1, w_2, \cdots, w_n$,則:

$\frac{x_1w_1+x_2w_2+\cdots+x_nw_n}{w_1+w_2+\cdots+w_n}$

稱為這 $n$ 個數的加權平均數(weighted average)。權(weight),代表數據的重要程度。權越大,該部分數據對最終平均數的影響力就越強(如同物理天平上較重的砝碼會使支點靠近它)。

例1 演講比賽成績表應用

假設選手A在內容上得分極高,但在舞台效果上稍弱。若採用「算術平均」,他可能與各項平庸的選手B同分;但若對「內容」賦予0.5的權重,對「效果」賦予0.2的權重,選手A的加權成績便因核心能力突出而勝出。加權平均數真實反映了選拔人才時的具體價值取向。

頻數作為權:處理群集數據

在統計大規模數據時(例如「例6 商場服裝部」營業員的月銷售額,或跳水隊運動員的年齡調查),相同的數值會多次出現。此時,出現的次數(頻數)自然成為該數值的權。

在求 $n$ 個數的平均數時,若 $x_1$ 出現 $f_1$ 次,$x_2$ 出現 $f_2$ 次,$\cdots$,$x_k$ 出現 $f_k$ 次(其中 $f_1+f_2+\cdots+f_k=n$),則這 $n$ 個數的平均數:

$\bar{x} = \frac{x_1f_1+x_2f_2+\cdots+x_kf_k}{n}$

也稱為這 $k$ 個數的加權平均數,其中 $f_1, f_2, \cdots, f_k$ 分別稱為 $x_1, x_2, \cdots, x_k$ 的權。透過此方式計算出的月銷售目標,可過濾個別極端高銷量的干擾,真實反映大多數營業員的普遍實力,從而制定出兼具挑戰性與可行性的獎勵制度。

組中值的智慧折衷

當數據被粗略分配至不同區間(數據分組)時,我們失去個體的具體數值。此時,一個小組的組中值是指該小組兩個端點數值的平均數。例如將區間中點與該區間的頻數相乘,即形成經典的加權計算模式:

$\bar{x} = \frac{11 \times 3 + 31 \times 5 + 51 \times 20 + 71 \times 22 + 91 \times 18 + 111 \times 15}{3+5+20+22+18+15}$

🎯 核心法則:尋找數據的真實重心
無論是人為設定的「重要程度」,還是自然發生的「頻數統計」,權的本質皆是賦予數據對應的引力。加權平均數並非單純的算術除法,而是協助我們在複雜數據中尋找不被極端值輕易欺騙的「真實中心」。